收录于话题
#计算机科学
55个
原文:How to Make Sense of Contradictory Science Papers
作者:Haixin Dang(利兹大学博士后研究员)、Liam Kofi Bright(伦敦经济学院的哲学系助理教授)
译者:武文浩
相信你已经读到过一些相互矛盾的研究结论。
比如,有的研究说 “喝红葡萄酒可能有益于心脏健康”,有的研究则认为 “喝红葡萄酒对心脏健康有害”,又比如在过去的一年里,有的论文说 “口罩对遏制新冠病毒的传播至关重要”,有的论文则认为 “口罩对新冠病毒的传播或影响不大”(译者注:还有计算机科学领域所司空见惯的,AI 算法用来预测某项疾病的准确率达到 90% 以上,但又有调查显示这些算法根本不准确)。
通常,人们会期望科学家在撰写并审核论文时谨慎行事,因此也会比较重视和信任已发表的研究,默认它们应该是充分论证过了的,且作者团队也相信论文所得出的结论。但现实是,科研论文的出版标准或许并没有人们所预想的那么高,有的时候,出版的科研论文 “既不需准确,也不需合理,甚至作者也不一定要‘相信’自己所得出的结论”。
当然,这不是在说 “科学家们会在论文结论中撒谎”,而是认为科学论文 “并不仅是报告研究的发现”,也可以看作是在履行重要的社会职能,因为对于研究者和论文来说,能引起人们对一个 “值得进一步调查” 的方向的注意也是可为的。
一个想法,或者说一个假设,并不需要一定是对的,只要这个想法或者假设能经得起论证,比如与所能得到的数据相符,那么,这样的想法或假设就能以科研论文的形式被发表出来,跟几个特定的科学家是否相信研究结论没有关系。
事实上,审核科研论文的同行评议过程本身,也不是为了审查论文是否有捏造数据或其它形式的学术不端存在的,而是为了将那些更 “值得被注意” 的内容筛选出来。因为很多时候,那些出乎意料和发人深省的发现,并不总是能跟我们 “判断一件事物是否真实” 的标准同道而行,而是在科研领域内接近极致的数据收集和处理下才得以显现。
此外,能在相对广阔的范围内,互相交流彼此认为有趣的想法,对科学家们能有效地对一些问题进行集体探究来说也是十分必要的。
比如,天体物理学家 Avi Loeb 就曾提出,我们已知的太阳系的第一个 “天外来客”—— Oumuamua 可能并非自然彗星,也有可能是一艘外星光帆太空船。当然,Avi Loeb 应该明白,他需要更多的数据和进一步的研究才能使得该假设成立,甚至他本人可能都对这个他自己提出的假设持 “不可知论” 的观点。
但 Avi Loeb 还是选择公布了他当时所掌握的有限数据,以及他基于这些数据所做的假设。尽管他的许多同僚都对他的论述提出了理由充分的异议,但对 Avi Loeb 本人来说,能将他的想法公之于众,并引起学界对此的关注和讨论,甚至公众对天文学和物理学的关注和讨论,就足够了,即有的时候发表学术论文并不是为了传播真理,而是在试图通往真理的过程中也让更多的人注意到一些 “令人兴奋且有趣的”、值得人们进一步调查和研究的事物。但是,为什么我们需要关注科学家们分享他们工作成果的方式呢?大多数读者可能会从 “制造和传播虚假信息的危害” 角度来思考这一问题,但这并非我们需要关注该问题的唯一理由。因为,现在的情况是,科研工作者们书写科研论文或报告的方式,与大多数人的阅读习惯间存在着严重的脱节,而鉴于科学家们通常需要基于他们所掌握的信息参与一些重要决策,由这种脱节所造成的科研信息与大众认知间的鸿沟,便很有可能会酿成灾难性后果。比如,在 20 世纪后半叶时,语言学研究对 “人类儿童是如何进行阅读和写作的” 提出了许多理论,而在缺乏实验和证据的情况下,由于当时的美国民众对于 “全语言法(the whole language approach)” 的接受度很高,美国政府大胆地对教育系统进行了一些列改革,在教儿童阅读时不再强调 “拼音” 的概念,而是强调单词在句中的意义。结果后续的研究却得出了政府方略相反的结论,发现重视发音的教学方法对儿童学习语言来说更为有效。我们这里要探讨的,并不是 “沟通鸿沟” 在某一个或几个特定事件中所构成的影响,而是过去所有由这种鸿沟所造成的负面影响加在一起,对公众是否还会在未来选择相信科学的影响。因为每当这种鸿沟对生活造成负面影响时,我们对科学的信任都会被腐蚀掉一点,而如果坐以待毙,我们对科学的信任最终便会被腐蚀殆尽。规避这一问题,需更清楚地认识 “发表科研论文” 的意义所在。哲学家卡尔 - 波普尔(Karl Popper)曾提出,科学(发展)需要大胆的猜想和尝试性的反驳,而这也正是现在我们所知的 “证伪主义” 的核心观点。对反驳持开放态度,曾是科学研究中最被人们广为赞赏的原则之一,但现在人们往往大多强调反驳的重要性,而忽略了大胆猜想的必要性。而本文认为,除了大胆猜想,科学家们互相沟通用的论文出版系统也需要做出改变,出版系统需要能高效地筛选出哪些猜想最值得关注,但又不能过于保守,以至于那些大胆的猜想会遭受到系统性地打压。我们在日常生活中,通常并不会有以上的这种担忧,比如,我问你 “把钥匙放哪了”,并不是想知道你关于锁匠的大胆论述,而只是想知道钥匙放哪了。这个例子中,沟通的双方都要满足一个 “很高” 的标准,沟通才能被完成,这一点也在哲学研究里有被充分讨论过。有的哲学家认为,标准在于,你必须知道你的论述是否真实。也有哲学家认为,这一标准是,即使你不知道你的论述是否真实,你的论述的真伪性也要能在论述的过程中得到证明。还有的哲学家认为,这一标准应该是,即使你既不知道也没有理由证明你的论述,你至少也要相信你是知道 “论述的真伪”,或者,相信你的论述是有逻辑的且能被证明 “是真的”。幸运的是,我们刚才所探讨这些哲学标准,并没被广泛地应用在科研沟通中。我们容忍了这样一个事实,即科研在其本质上可视作一种猜测性工作,科研工作者必须不断地对自然界中的惊喜持开放态度,并在概念上展开及探索任何的新发现。但问题在于,公众对科学的常识性尊重,很可能会使他们做出一些无益的假设,比如有一项研究的结论与我们平常的生活习惯有出入,则会惯性思考地认为,那篇论文的结论比生活经验要可靠,那篇论文应该是被充分论证过了的且足够可信。很明显,上述的那种惯性思考所得结论并不可靠。可以想象,当一名普通大众仔细拜读一篇结论令人 “眼前一亮” 的论文,并发现数据支撑并不足以令人信服时,该会有多么的失望。想让科学家们在工作中,达到哲学家们所探讨的那些沟通中的 “高标准” 并未易事,而科研本身其实也需要人们对已发表的主张采取 “宽容和开放” 的态度,以使科研工作者们能更好地完成他们的重要工作。此外,在传统的学术出版之外互相交流成果的现象已经越来越常见,我们又应如何看待发布在 medRxiv 和 bioRxiv 等在线档案库上的预印版(preprints) 论文日益增长的影响力呢?当前的科技记者们在报道中越来越依赖于未经同行评议的论文,这逐渐改变了科学传播的规范。比如说过去的一段时间里,公众以前所未有的速度直接参与到与 COVID-19 有关的研究中,而科研工作者们也因此能更快捷地了解同僚的研究,并跳过期刊发表和同行评审相互交流。但这种开放性,或者说便捷性,也有可能会导致人们误解论文所要传达的内容。预印版论文与最终发表的严谨论文间存在着一定差距,它们为我们所呈现的,是那些相对而言更为混乱和大胆的猜想,而为了避免之前所提到的 “沟通鸿沟” 造成不好的结果,我们就必须要清楚认识到,经过严谨审核的研究,与预印本间的区别,也要认识到,发表论文并非是要阐述一个 “真理”,而是要与人们共享一个想法、一个猜想,进而引发更多对此的思考和研究。比如,之前提到的 Avi Loeb,他其实可能并不相信太阳系的第一个 “天外来客” 会是外星飞船,但他所提出的那种可能仍是严谨的科学,而非某种胡思乱想。1、https://nautil.us/issue/100/outsiders/how-to-make-sense-of-contradictory-science-papers数据实战派希望用真实数据和行业实战案例,帮助读者提升业务能力,共建有趣的大数据社区。